BSTAT · PROBLEMAS DE DOS MUESTRAS · PUERTA 9

Comparación de
Dos Poblaciones

Marco conceptual para hacer inferencias sobre diferencias de medias y proporciones en muestras independientes, pareadas y grandes.

9.1Medias — Muestras grandes independientesZ · n≥30
9.2Medias — Muestras pequeñas independientest · n<30
9.3Medias — Muestras pareadast · d̄
9.4Dos proporciones poblacionalesZ · p̂
9.5Consideraciones de tamaño de muestran = ?

Ref.: Shafer & Zhang (2012). Introductory Statistics. Saylor Academy. Cap. 9.

00
Diapositiva 02 · Objetivos
Al terminar esta sesión comprenderás…
1
El marco conceptual para comparar dos poblaciones: por qué trabajamos con diferencias de parámetros, qué significa que las muestras sean "independientes" y cuándo aplica cada método.
2
Cómo elegir entre Z y t según el tamaño de muestra y las condiciones que requiere cada uno: normalidad, varianzas iguales e independencia.
3
Por qué el muestreo pareado es un diseño poderoso: cómo calcular diferencias elimina la variabilidad de fondo y te permite enfocarte en el factor de interés.
4
Cómo la lógica de comparar dos proporciones poblacionales es paralela a la de las medias, y cuál es el supuesto crítico de muestras independientes.
5
Cómo pensar en el tamaño de muestra antes de recolectar datos: por qué planear con anticipación ahorra tiempo, dinero y lleva a conclusiones más sólidas.
Diapositiva 03 · Marco general
El panorama general — ¿por qué comparar dos poblaciones?
Idea central
Rara vez nos interesa una sola población de forma aislada. Las preguntas reales son comparativas: ¿El Medicamento A funciona mejor que el B? ¿La Empresa 1 es más confiable que la 2? ¿El proceso nuevo supera al anterior? Todo el capítulo 9 trata sobre hacer inferencias estadísticamente válidas sobre diferencias.
🔑 La idea central en las cinco secciones
  • Nunca conocemos los parámetros reales μ₁, μ₂, p₁, p₂
  • Los estimamos con muestras y luego trabajamos con la diferencia
  • El estimador puntual siempre es la diferencia de estadísticos: x̄₁ − x̄₂ o p̂₁ − p̂₂
  • Construimos un IC o probamos H₀: parámetro₁ − parámetro₂ = D₀
  • D₀ = 0 en la mayoría de los problemas reales ("no hay diferencia")
🗺️ Mapa de decisión — ¿cuál método usar?
SituaciónEstadísticoCondición clave
Medias, grandes independientesZn₁ ≥ 30 Y n₂ ≥ 30
Medias, pequeñas independientest (gl = n₁+n₂−2)Pobs. normales, σ₁ = σ₂
Medias, pareadast (gl = n−1)Diferencias normales
Proporciones, grandesZAmbas muestras grandes
9.1
Diapositiva 04 · Muestras Grandes Independientes
Comparar medias — muestras grandes e independientes (Z)
Concepto clave — independencia
Dos muestras son independientes si cada una se extrae sin ninguna referencia a la otra. La muestra de la Población 1 no nos dice nada sobre quién queda en la muestra de la Población 2. Esto es lo que hace válido el estadístico Z.
📐 Lógica del intervalo de confianza
IC para μ₁ − μ₂ (grandes, independientes)
(x̄₁ − x̄₂) ± zα/2 · √(s₁²/n₁ + s₂²/n₂)
La parte ± es el margen de error. El error estándar combina la variabilidad de ambas muestras. Si σ₁ y σ₂ son conocidas, usarlas en lugar de s₁ y s₂.
Estadístico de prueba estandarizado
Z = [(x̄₁ − x̄₂) − D₀] / √(s₁²/n₁ + s₂²/n₂)
Sigue N(0,1). Misma lógica de valor crítico / valor-p que la prueba Z de una población.
💡 Cómo interpretar los resultados
El IC indica un rango de diferencias plausibles
Si el IC contiene solo valores positivos → evidencia de que μ₁ > μ₂
Si contiene solo valores negativos → evidencia de que μ₁ < μ₂
Si cruza el cero → no hay evidencia suficiente de diferencia
Formas de H₀
H₀: μ₁ − μ₂ = D₀ (usualmente 0)
Hₐ izquierda: μ₁ − μ₂ < D₀ · Hₐ derecha: μ₁ − μ₂ > D₀ · Hₐ dos colas: μ₁ − μ₂ ≠ D₀
Idea clave
El método es idéntico al de una población — solo reemplaza la media muestral por la diferencia de medias muestrales.
9.2
Diapositiva 05 · Muestras Pequeñas Independientes
Comparar medias — muestras pequeñas e independientes (t)
Concepto clave — cuando el TCL no aplica
Cuando al menos una muestra es pequeña (n < 30), el Teorema Central del Límite no garantiza la normalidad de x̄. Debemos imponer dos condiciones sobre las poblaciones: ambas son normalmente distribuidas Y tienen desviaciones estándar iguales. A cambio, usamos la distribución t.
🔗 La varianza combinada — por qué existe
Intuición
Asumimos σ₁ = σ₂ (varianzas iguales). En lugar de usar s₁ y s₂ por separado, las combinamos en un estimador mejor: s²p. Es un promedio ponderado, dando más peso a la muestra más grande.
Varianza combinada s²p
s²p = [(n₁−1)s₁² + (n₂−1)s₂²] / (n₁+n₂−2)
gl = n₁ + n₂ − 2
IC y estadístico de prueba (muestras pequeñas)
IC: (x̄₁−x̄₂) ± tα/2 · √[s²p(1/n₁+1/n₂)]
T = [(x̄₁−x̄₂)−D₀] / √[s²p(1/n₁+1/n₂)]
🆚 Muestras grandes vs. pequeñas — diferencias clave
Aspecto
Grandes (Z)
Pequeñas (t)
Tamaño requerido
Ambas ≥ 30
Al menos una < 30
Distribución pob.
Cualquiera (TCL)
Ambas deben ser normales
¿Varianzas iguales?
No se requiere
Sí se requiere (σ₁ = σ₂)
Estadístico
Z ~ N(0,1)
T ~ t(n₁+n₂−2)
⚠️ Matiz importante
Aunque una muestra sea ≥ 30 y la otra < 30, debes usar el enfoque t de muestras pequeñas. "Pequeña" significa que al menos una es pequeña.
9.3
Diapositiva 06 · Muestras Pareadas
Comparar medias — muestras pareadas · la ventaja del diseño
Concepto clave — eliminar el ruido estadístico
El muestreo pareado es un diseño poderoso: al comparar pares que son iguales en todo excepto el factor de interés, elimina la variabilidad no deseada (ej. diferencias entre autos al comparar combustibles). Esto permite detectar si el tratamiento realmente hace una diferencia.
🔄 La transformación: dos muestras → una muestra
Cómo funciona
Para cada par, calcula d = x₁ − x₂ (¡siempre en el mismo orden!). Ahora tienes una sola muestra de diferencias d₁, d₂, …, dₙ. Trátala como tus datos. El problema se convierte en una prueba t de una muestra sobre d̄.
IC para μd = μ₁ − μ₂ (pareadas)
d̄ ± tα/2 · (sd / √n)
gl = n − 1 · Estimador puntual = d̄ · Si n ≥ 30, puede usarse zα/2
Estadístico de prueba (pareadas)
T = (d̄ − D₀) / (sd / √n)
H₀: μd = D₀ · Hₐ puede ser izquierda, derecha o dos colas.
⚖️ Pareadas vs. Independientes — cuándo elegir cada una
Usa muestras pareadas cuando…
Las observaciones naturalmente vienen en pares (antes/después, gemelos, sujetos emparejados). La variable de emparejamiento (ej. modelo de auto) podría introducir variabilidad que enmascararía el efecto de interés.
No uses análisis pareado incorrectamente
Si las muestras son verdaderamente independientes (seleccionadas al azar sin emparejamiento), es incorrecto usar las fórmulas pareadas. La estructura de los datos determina el método, no la preferencia del investigador.
¡El orden importa!
Restar siempre en el mismo sentido (siempre Auto 1 menos Auto 2) es crítico. Un orden inconsistente produce un d̄ sin sentido.
9.4
Diapositiva 07 · Dos Proporciones Poblacionales
Comparar dos proporciones — la estructura paralela
Concepto clave — misma lógica, parámetro diferente
Todo lo de las secciones 9.1–9.3 aplica aquí, pero reemplazamos medias con proporciones. El estimador puntual de p₁ − p₂ es p̂₁ − p̂₂. Usamos Z (no t) porque se requieren muestras grandes para que la aproximación normal sea válida.
📐 Fórmulas
IC para p₁ − p₂ (muestras grandes)
(p̂₁−p̂₂) ± zα/2·√[p̂₁(1−p̂₁)/n₁ + p̂₂(1−p̂₂)/n₂]
Estadístico de prueba
Z = [(p̂₁−p̂₂)−D₀] / √[p̂₁(1−p̂₁)/n₁ + p̂₂(1−p̂₂)/n₂]
✅ Condición de "muestra suficientemente grande"
Ambos intervalos deben estar dentro de [0,1]
Verificar: [p̂ᵢ ± 3√(p̂ᵢ(1−p̂ᵢ)/nᵢ)] ⊂ [0,1] para cada muestra. Es más matizado que simplemente n ≥ 30 — depende del valor de p̂.
⚠️ Advertencia crítica — supuesto de independencia
🚨
La trampa de la encuesta electoral
Si encuestas a las mismas personas y les pides elegir entre el Candidato A y B, entonces p̂A y p̂B provienen de la misma muestra, no de dos muestras independientes. Las fórmulas del IC y el estadístico de prueba de esta sección son inválidas en ese caso.
La lógica es idéntica a la de medias
H₀: p₁ − p₂ = D₀ (usualmente 0)
Hₐ de tres formas: izquierda, derecha o dos colas
Interpretación del IC: ¿incluye el cero?
9.5
Diapositiva 08 · Tamaño de Muestra
Tamaño de muestra — planear antes de recolectar datos
Concepto clave — planear ahorra recursos
Cada muestra cuesta tiempo, dinero y esfuerzo. Antes de recolectar datos, debemos estimar el tamaño mínimo de muestra necesario para lograr un margen de error E deseado con un nivel de confianza dado. Muy pequeña → inconclusiva. Muy grande → desperdicio.
📏 Para medias — muestras independientes
Tamaños iguales mínimos n₁ = n₂
n = (zα/2)²(σ₁² + σ₂²) / E² (redondear hacia arriba)
Fijamos n₁ = n₂ porque no podemos resolver para dos incógnitas. σ₁ y σ₂ deben conocerse o estimarse de datos previos.
📏 Para medias — muestras pareadas
Número mínimo de pares n (pareadas)
n = (zα/2)² σd² / E² (redondear hacia arriba)
σd es la DE de la población de diferencias. Válido cuando n ≥ 30 (usamos z, no t).
📏 Para proporciones
Tamaños iguales mínimos n₁ = n₂
n = (zα/2)²[p̂₁(1−p̂₁) + p̂₂(1−p̂₂)] / E²
Si p̂₁ y p̂₂ son desconocidas, usar 0.5 para cada una (estimación conservadora — da el n máximo). Si solo una es desconocida, usar 0.5 solo para esa.
Los tres ingredientes
Toda fórmula de tamaño de muestra necesita exactamente tres cosas:
zα/2 — del nivel de confianza
σ o p̂ — de conocimiento previo o datos piloto
E — el margen de error máximo deseado, fijado por el investigador
Diapositiva 09 · Síntesis
Los cinco métodos — lado a lado
Sección
Estadístico
Condiciones
Fórmula del EE
Grados de libertad
9.1 Medias, grandes indep.
Z
n₁≥30, n₂≥30, indep.
√(s₁²/n₁ + s₂²/n₂)
∞ (tabla Z)
9.2 Medias, pequeñas indep.
T
Pobs. normales, σ₁=σ₂, indep.
√[s²p(1/n₁+1/n₂)]
n₁+n₂−2
9.3 Medias, pareadas
T
Diferencias normales
sd/√n
n−1
9.4 Proporciones, grandes
Z
Muestras grandes, indep.
√[p̂₁q̂₁/n₁+p̂₂q̂₂/n₂]
∞ (tabla Z)
El patrón universal de H₀
En las cuatro pruebas, la hipótesis nula tiene la misma forma:
H₀: [parámetro₁] − [parámetro₂] = D₀
Usualmente D₀ = 0 ("sin diferencia"). La alternativa puede ser izquierda, derecha o dos colas.
El IC siempre se interpreta igual
Si el IC contiene el 0 → no hay diferencia significativa al nivel de confianza dado.
Si el IC es completamente positivo → el Parámetro 1 es mayor.
Si el IC es completamente negativo → el Parámetro 2 es mayor.
?
Diapositiva 10 · Verificación de comprensión
Preguntas conceptuales — comprensión, no cálculo
P1
Dos muestras independientes de tamaños n₁ = 45 y n₂ = 18. ¿Cuál método corresponde?
  • a Z (muestras grandes) — ambas son suficientemente grandes
  • b ✓ t (muestras pequeñas) — n₂ < 30, por lo que al menos una es pequeña
  • c t pareada — hay que calcular diferencias
P2
¿Por qué el muestreo pareado suele detectar mejor un efecto real que el muestreo independiente?
  • a Porque las muestras pareadas siempre son más grandes
  • b ✓ Porque el emparejamiento elimina la variabilidad de fondo (ruido estadístico), facilitando detectar el efecto del tratamiento
  • c Porque la distribución t tiene colas más anchas que la Z
P3
Un IC del 95% para μ₁ − μ₂ es [−3.1, 1.4]. ¿Qué puedes concluir?
  • a μ₁ es significativamente mayor que μ₂
  • b ✓ No hay evidencia suficiente de diferencia — el IC contiene el cero
  • c μ₂ es significativamente mayor que μ₁
P4
La varianza combinada s²p se usa en el caso de muestras pequeñas. ¿Qué supuesto la hace válida?
  • a Los dos tamaños de muestra deben ser iguales
  • b ✓ Las desviaciones estándar poblacionales deben ser iguales (σ₁ = σ₂), así se justifica combinar dos estimadores del mismo valor
  • c Las poblaciones deben tener la misma media
P5
En una muestra pareada, olvidas restar siempre en el mismo orden. ¿Qué ocurre?
  • a El estadístico de prueba se vuelve más grande, lo que es mejor
  • b ✓ El d̄ calculado pierde sentido — diferencias positivas y negativas se cancelan al azar, ocultando el efecto real
  • c Nada — el signo de la diferencia no importa
P6
Para planear el tamaño de muestra de dos proporciones sin estimaciones previas de p₁ y p₂, ¿qué valor usas?
  • a p̂ = 0 para ambas — estimación mínima
  • b ✓ p̂ = 0.5 para ambas — estimación conservadora que da el tamaño de muestra más grande (y más seguro)
  • c p̂ = 1 para ambas — estimación máxima
LLEGANDO · PROBLEMAS DE DOS MUESTRAS · TERMINAL 9

Ideas clave

9.1 — Grandes, indep.
Estadístico Z. Ambas n ≥ 30, muestras independientes. Estimador = x̄₁ − x̄₂. Misma lógica IC + hipótesis que una sola población.
9.2 — Pequeñas, indep.
Estadístico t, gl = n₁+n₂−2. Requiere pobs. normales Y σ₁=σ₂. Usa varianza combinada s²p. "Pequeña" = al menos una n < 30.
9.3 — Pareadas
Calcula d = x₁−x₂ por par (¡orden consistente!). t sobre d̄, gl = n−1. Diseño poderoso: elimina variabilidad de fondo.
9.4 — Proporciones
Estadístico Z, muestras grandes. Verificar [p̂±3EE] ⊂ [0,1]. Ojo: p̂A y p̂B de la misma encuesta NO son muestras independientes.
9.5 — Tamaño n
n = (z)²(σ²)/E² · Tres ingredientes: nivel de confianza, DE poblacional y margen de error deseado. Usar 0.5 cuando p̂ es desconocida.
BIBLIOGRAFÍA
Shafer, G. & Zhang, Z. (2012). Introductory Statistics. Saylor Academy.
Capítulo 9: Two-Sample Problems.
saylordotorg.github.io/text_introductory-statistics/s13-two-sample-problems.html